生存分析绘制生存曲线在上一篇文章中,我们已经得到了预后模型,根据预后模型我们可以计算每个病人的风险值,然后根据得到的ROC曲线可以找到最优的cutoff,然后就可以将病人分为高低风险两组,最后我们就能够绘制如下生存曲线这个是TCGA数据库的生存曲线: 我们可以看到,在这个生存曲线里面横坐标是生存时间,单位是年,纵坐标是生存率,随着时间的推移,病人的生存率是下降的。然后我们可以将病人分为高低风险两组,红色代表高风险组,蓝色代表低风险组,我们在这个图里面可以看出这两组之间曲线是分开的,就说明这两组之间生存是具有差异的,但具体是否具有差异,我们要看Pvalue值,如果P小于0.05,就说明高低风险组的生存是具有差异的,所以这里的高低风险量组生存差异是非常显著的 接着我们再看一下图形的下半部分 下半部分的话,它的横坐标是生存时间,单位是年,纵坐标是高低风险的一个划分。每个时间点都有数值,这个数值代表高低风险组在每个时间点剩余病人的数目。 接下来就是GEO数据库的生存曲线: GEO作为验证组的话,它的P值肯定是不如这个训练集那么显著。我们可以看到这里的P值是0.036,也是小于0.05,就说明GEO数据库可以验证我们这个模型的准确性,说明在GEO数据库里面我们也可以通过这个模型得到高低风险组。 下面我们来看一下绘制生存曲线需要的输入文件,输入文件是我们上一篇文章中得到GEO数据库和TCGA数据库的风险文件,以及我们事先写好的脚本文件。 接着我们只要运行脚本文件,就可以得到两个数据库的生存曲线图了。 视频购买链接: 《免疫基因对文章套路视频》 精品课程推荐: 《GEO数据库miRNA芯片挖掘》 《甲基化肿瘤分型文章套路视频》 《TCGA肿瘤免疫细胞浸润模式挖掘》 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |